ارائه رویکردی مبتنی بر سنجه برای ارزیابی کیفیت مجموعه داده های پیوندی پیش از انتشار

پایان نامه
چکیده

هدف اصلی داده¬های پیوندی، تحقق وب معنایی و استخراج دانش از طریق پیوند دادن داده¬های موجود روی وب می¬باشد. یکی از موانع دستیابی به این هدف، وجود مشکلات و خطاها در داده¬های منتشر شده است که باعث ایجاد پیوندهای نادرست و درنتیجه استنتاج¬های نامعتبر می¬گردد. مطالعه کارهای انجام شده در این حوزه نشان می¬دهد که بیشتر محققان بر ارزیابی کیفیت داده پس از انتشار تمرکز داشته¬ و ارزیابی داده¬ها پیش از انتشار را برعهده مالک یا منتشرکننده داده گذاشته¬اند. با توجه به اینکه کیفیت داده¬ها تأثیر مستقیم بر موفقیت پروژه داده¬های پیوندی و تحقق وب معنایی دارد، بهتر است تا کیفیت هریک از مجموعه¬های داده در مراحل اولیه انتشار و قبل از اضافه شدن به ابر داده¬های پیوندی ارزیابی شود. در این رساله، یک رویکرد مبتنی بر سنجه برای ارزیابی پیش از انتشار مجموعه داده¬های پیوندی ارائه می¬شود. برای این منظور، با مطالعه مدل¬ها و چارچوب¬های کیفیت داده، مدل iso-25012 به¬عنوان مدل مبنا انتخاب و با نگاشت ابعاد کیفیت مدل مبنا به ابعاد کیفیت داده¬های پیوندی، شش بُعد کیفی کامل¬بودن، دقت معنایی، دقت نحوی، سازگاری، یکتایی و پیوندپذیری به¬عنوان ابعاد کیفیت ذاتی داده¬های پیوندی شناسایی شده¬اند. سپس، با استفاده از رویکرد هدف، پرسش، سنجه برای هریک از ابعاد کیفی شش¬گانه، سنجه¬های مناسب تعریف و به¬صورت رسمی بیان شده است. استراتژی ارزیابی مدل پیشنهادی، شامل سه مرحله اعتبارسنجی تئوری، ارزیابی تجربی به روش آزمایشات و نظرسنجی از خبرگان بوده که فرایند اجرای هریک، به تفصیل در رساله مورد بررسی قرار گرفته است. در پایان، با بهره¬گیری از روش¬های یادگیری، یک مدل پیش¬بینی کیفیت برمبنای سنجه¬های پیشنهادی ارائه ¬شده است. نتایج ارزیابی¬ها نشان داد که سنجه¬های پیشنهادی معتبر، کاربردی و مقیاس¬پذیر هستند و همچنین قابلیت ارزیابی کیفیت ذاتی هر مجموعه داده را به¬صورت کاملاً خودکار دارند. بنابراین، منتشرکنندگان داده¬ها قادرند تا با استفاده از مدل پیشنهادی، کیفیت ذاتی مجموعه داده خود را قبل از انتشار ارزیابی کنند.

منابع مشابه

ارائه رویکردی نوین و خودکار به منظور تولید داده های تست مبتنی بر روشهای تصادفی

فرآیند تست 50% کل هزینه توسعه نرم افزار را شامل می شود. به منظور تست نرم افزار، باید مجموعه ای از داده‌های تست ایجاد شوند که تولید این مجموعه، کاری بسیار زمانبر بوده و تاثیر مستقیمی بر هزینه فرآیند تست خواهد داشت. بدون خودکارسازی، این فرآیند، کند، پرهزینه و همراه با خطا خواهد بود. در این مقاله روش جدیدی به منظور تولید داده های تست بر مبنای الگوریتمهای تصادفی با ترکیب روشهای ایستا و پویا ارائه ش...

متن کامل

ارائه یک سیستم پیشنهاد استناد مبتنی بر داده های پیوندی

حجم فراوان و روبه رشد مقالات منتشر شده بر روی وب، فرآیند تصمیم گیری و انتخاب مقالات مرتبط با یک زمینه تحقیقاتی را برای پژوهشگران دشوار کرده است. روش رایجی که اغلب پژوهشگران برای جستجوی اسناد مرتبط با یک زمینه تحقیقاتی استفاده می کنند، یافتن کلمات کلیدی و استفاده از موتورهای جستجو می باشد. با توجه به این که پیدا کردن لیست کلمات کلیدی که دربرگیرنده تمام مقالات یک زمینه باشند کاری دشوار است، با اس...

15 صفحه اول

ارائه رویکردی مبتنی بر منطق فازی برای ارزیابی میزان رضایت مشتری

در این مقاله، رویکردی منطبق بر منطق فازی جهت ارزیابی میزان رضایت مشتری ارائه شده و شاخص­های رضایتمندی نیز مورد بررسی قرار گرفته است. احتمال موفقیت یکئ سازمان در بازار به شدت به سطح رضایت مشتری، بستگی دارد. برای بهبود عملکرد‎ رضایتمندی مشتری در کسب و کار، یک روشِ ارزیابی عملکرد‎ مدیریت ارتباط با مشتری، بر اساس ارزیابی فازی می ­باشد. به همین منظور جهت افزایش نرخ موفقیت در اجرای سیستم­های مدیریت ار...

متن کامل

ارائه رویکردی مبتنی بر منطق فازی برای ارزیابی میزان رضایت مشتری

در این مقاله، رویکردی منطبق بر منطق فازی جهت ارزیابی میزان رضایت مشتری ارائه شده و شاخص­های رضایتمندی نیز مورد بررسی قرار گرفته است. احتمال موفقیت یکئ سازمان در بازار به شدت به سطح رضایت مشتری، بستگی دارد. برای بهبود عملکرد‎ رضایتمندی مشتری در کسب و کار، یک روش ارزیابی عملکرد‎ مدیریت ارتباط با مشتری، بر اساس ارزیابی فازی می ­باشد. به همین منظور جهت افزایش نرخ موفقیت در اجرای سیستم­های مدیریت ار...

متن کامل

ارائه ی رویکردی برای کاهش هزینه های کیفیت در اندازه گیری پارامترهای شیمیایی با استفاده از تکنیک های داده کاوی

در بازارهای رقابتی امروزی، مقوله ی کیفیت بیش از پیش مورد توجه تولیدکنندگان قرار گرفته است. در این راستا، یکی از موضوعاتی که از اهمیت زیادی برخوردار است، بحث پیرامون هزینه های کیفیت است. تولیدکنندگان همواره برسر دوراهی بین کیفیت بالای محصولات و هزینه های آن قرار می گیرند. در این نوشتار سعی شده تا با استفاده از تکنیک های داده کاوی، داده های مربوط به پارامترهای شیمیایی رنگ آمیزی به روش موقعیت زدای...

متن کامل

ارائه رویکردی نوین و خودکار به منظور تولید داده های تست مبتنی بر روشهای تصادفی

فرآیند تست 50% کل هزینه توسعه نرم افزار را شامل می شود. به منظور تست نرم افزار، باید مجموعه ای از داده های تست ایجاد شوند که تولید این مجموعه، کاری بسیار زمانبر بوده و تاثیر مستقیمی بر هزینه فرآیند تست خواهد داشت. بدون خودکارسازی، این فرآیند، کند، پرهزینه و همراه با خطا خواهد بود. در این مقاله روش جدیدی به منظور تولید داده های تست بر مبنای الگوریتمهای تصادفی با ترکیب روشهای ایستا و پویا ارائه ش...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023